Relação entre Parùmetros

Os modelos precisam de um parĂąmetro que controla a diversidade na metacomunidade e um que controla a dispersĂŁo. A relação entre os parĂąmetros de diversidade pode ser obtida a partir da igualdade proposta por por Vallade & Houchmandzadeh (2003) \(\theta = \frac{U (J_M - 1)}{1-U}\). Para isso aproximamos o nĂșmero de indivĂ­duos na metacomunidade como \(J_M = A_{landscape} * DA_{obs}*p\).

O parùmetro m é a probabilidade de um evento de colonização na comunidade local ser por um propågulo da metacomunidade (Hubbel 2001). Podemos definir m como a média das probabilidades de cada sítio na comunidade local ser colonizada por um imigrante (eq 1; Chisholm & Lichstein 2009).

\[ eq 1: m = \frac{1}{A} \int \int_A m_{x,y} dxdy \]

Aproximamos as comunidades locais como åreas quadradas com lado L, que pode ser obtido por \(L = 100\sqrt{J/DA}\). Assim podemos reescrever a equação 1 como:

\[ eq 2.a : m = \left(\frac{1}{L} \int\limits_{-L/2}^{L/2} m_{x}(x)\mathrm{d}x \right)^2 \]

\[ eq 2.b :m_{x} = 1 - \int\limits_{-L/2}^{L/2} K(x-y) \mathrm{d}y \]

Onde K é a função de dispersão. Na simulação coalescente a dispersão resulta do sorteio indepentende de duas distribuiçÔes de Laplace em eixos ortogonais centradas no sítio vago (figura X). Se consideramos a distribuição de Laplace como \(K(x) = \frac{\alpha}{2} e^{-|\alpha x|}\) (idem para o eixo y), então:

\[eq3:m = (\frac{1-e^{-\alpha L}}{\alpha L})^2\]

Onde \(\alpha = 1/b\), b é o parùmetro escalar da distribuição de Laplace que pode ser escrito em função do desvio-padrão da distribuição de Laplace (d) \(b = d/ \sqrt{2}\). o desvio padrão corresponden à distùncia média de dispersão (Clark et al. 1999). Podemos reescrever a equação de m em funçao de d:

\[ eq4: m = d \frac{1 - e^{-\frac{\sqrt{2} L}{d}} }{\sqrt{2} L} \]

Com a equação 4 podemos calcular m a partir do desvio padrĂŁo da função de dispersĂŁo. Essa equação Ă© vĂĄlida para o processo de dispersĂŁo em paisagens homogĂȘneas. Na simulação coalescente, uma vez que sorteamos um progenitor e este estaria presente em uma unidade de nĂŁo habitat, o sorteio Ă© refeito atĂ© que o progenitor esteja em uma unidade de habitat. Uma aproximação do efeito da fragmentação no calculo de m pode ser obtido por:

\[eq.5: m' = \frac{mp}{1 - (1-p)m} \]

Onde p é a porcentagem de cobertura vegetal na paisagem. Caso seja necessårio calcular d a partir de m, utilizamos o ramo principal da função W de Lambert (\(W_{0}\)):

\[ eq6: d = \frac{\sqrt{2} L}{m W_{0}(- \frac{e^{-1/m}}{m} ) + 1} \]

AnĂĄlise EstatĂ­stica Completa

Descrição dos Levantamentos Selecionados

Figura 1. Na primeira linha hå as variåveis na escala padrão; na segunda linha as variåveis após transformação Z (centra a média em zero e desloca a variação para o centro da distribuição REVISÃO). As linhas em vermelho equivalem ao quantil de 0.25%, 0.50% e 0.75% da amostra. S = riqueza observada; p = proporção de cobertura vegetal na paisagem

A proporção de cobertura vegetal variou de 0.0074 atĂ© 1, o quantil de 25% Ă© de 0.2916, a mĂ©dia Ă© 0.6727 e o quantil de 75% Ă© de 0.9216 (figura 1). A riqueza observada variou de 26 atĂ© 230, o quantil de 25% Ă© de 73.75, a mĂ©dia Ă© 105.85, e o quantil de 75% Ă© 134 (figura 1). HĂĄ um vies na amostra que apresenta mais trabalhos em paisagens com alta cobertura vegetal do que em baixas, por exemplo, o primeiro 1/4 da amostra estĂĄ entre 0.00 e 0.30, enquanto o Ășltimo 1/4 estĂĄ comprimido entre 0.92 e 1 (figura 1). A riqueza observada apresenta um outro padrĂŁo com uma tendĂȘncia central e uma assimetria para a esquerda [REVISAR]: 50% da amostra estĂĄ entre 73 e 134 com mĂ©dia e mediana prĂłximos de 100; o primeiro 1/4 da amostra estĂĄ entre 26 e 73 enquanto o Ășltimo 1/4 varia entre 134 e 230, o range do 1o quarto equivale Ă  metade do range do Ășltimo quarto da amostra. HĂĄ certa covariação entre p e S: o Ășltimo quarto de p varia acima do quantil de 25%; enquanto o primeiro quarto de p varia atĂ© a mediana de S. PorĂ©m os 50% centrais de cada variĂĄvel estĂŁo representadas em todo o gradiente de variação da outra, e.g., entre o quantil de 25% e 75% de p observamos S que varia desde de valores inferiores Ă  50 atĂ© superiores Ă  200; e um padrĂŁo se observa para S. Para realizar a anĂĄlise estatĂ­stica aplicamos a transformaçaĂ” Z em p e S. A transformação Z centraliza no zero a mĂ©dia da distribuição e converte da escala da variĂĄvel para a de desvio-padrĂ”es; dessa forma torna-se mais direta a interpretação de modelos lineares generalizados hierarquicos (REF 2006). Essa transformação move a variação para a regiĂŁo central da distribuição mantendo a relação geral entre as observaçÔes (figura 1). NĂŁo hĂĄ motivos a priori para pensar que a predição dos modelos pode ser influĂȘnciada pela covariação entre p e S. [DÚVIDA] Paulo, lembro que discutimos sobre a relação entre teste frequentista e o efeito de S * p; me recordo de algo como que ao utilizar o p-valor estariamos de alguma forma ponderando isso [DÚVIDA].

CongruĂȘncia entre SAD observada e predita

Auditoria das Replicas

Espera-se que quanto maior a estatística D do teste de Kolmogorov-Smirnov menor o p-valor observado. Não esperamos observar relação entre p-valor, J e S. Segue avaliação destas espectativas

Figura 2. o p-valor obtido do teste KS (eixo y) e a maior distĂąncia entre os vetores de abundĂąncia (KS), tamanho da amostra (J) e riqueza observada (S).

O método parece estar adequado: i) KS.p e KS.D apresentam uma relação inversa; ii) não hå covariação entre KS.p com J e S.

Modelo EstatĂ­stico

Consideramos que um modelo neutro nĂŁo foi refutado quando o p-valor for maior ou igual Ă  5%. Contabilizamos o nĂșmero de prediçÔes nĂŁo refutadas (Goodness-of-fit) e modelamos a probabilidade de uma predição nĂŁo ser refutada usando um modelo logito. Agrupamos os dados pelo SĂ­tio de observação (Site). É possĂ­vel agrupar os dados considerando um intercepto por sĂ­tio (1|Site); 1 intercepto por modelo neutro (MN|Site); ou com 1 intercepto e 1 inclinação para k por modelo neutro (k*MN|Site). Na Ășltima opção k precisa ser interpretado como variĂĄvel contĂ­nua. Um protocolo de seleção de modelos hierarquicos pode ser encontrado em Zuur et al. 2009 onde se recomenda comparar formas alternativas de agrupar os dados a partir do modelo cheio da relação entre as preditoras. O modelo cheio proposto foi com a interação de terceiro grau entre as preditoras p, k e MN. Comparamos todas as combinaçÔes possĂ­veis por verossimilhança [DÚVIDA] se entendo corretamente, os parametros da estrutura aleatĂłria sĂŁo estimados pelo R2 e os estrutura fixa por algo similar Ă  verossimilhança; entĂŁo precisa utilizar o parĂąmetro REML=TRUE [DÚVIDA]

Tabela 1 Qual o melhor modelo cheio?

O modelo estatĂ­stico com k como fator e agrupamento dos dados como MN|Site foi o Ășnico plausĂ­vel.

Tabela 2 Qual a relação entre as variåveis é mais plausível?

O Ășnico modelo plaĂșsivel Ă© aquele que inclui a interação de terceiro grau. Vamos avaliar os resĂ­duos quantĂ­licos utilizando o pacote DHARMa (REF). Se o modelo estatĂ­stico estĂĄ fazendo um ajuste adequado entĂŁo a distribuição dos resĂ­duos quantĂ­licos deve ser prĂłximo a de uma distribuição normal (REF).

Figura 2. ResĂ­duos quantĂ­licos do modelo mais plaĂșsivel [aquele que inclui p:k:MN], para detalhes ver documentação da função simulateResiduals.

A distribuição dos resĂ­duos quantĂ­licos do modelo mais plausĂ­vel nĂŁo apresenta boa aderĂȘncia Ă  uniformidade.

Anexo:

Imagens das matrizes de paisagem